AI PPT,这次是真不用返工了
AI PPT,这次是真不用返工了过去一两年,AI做PPT这事儿一直处在一个比较尴尬的位置。
搜索
过去一两年,AI做PPT这事儿一直处在一个比较尴尬的位置。
上次给大家分享了一个 CUA 的开源项目,能让 AI Agent 直接操控电脑界面,相当于把任何 App 都变成 Agent 的 Skill。反响还不错。
Agent Skills不应该只以SKILL.md、README或自然语言说明文档的形式存在,而应该被转成一种机器可检索、可检查、可治理的结构化表示。这是《From Skill Text to Skill Structure: The Scheduling-Structural-Logical Representation for Agent Skills》这篇论文的核心主张。
4 月 9 日,Anthropic 在 X 上宣布 Claude Managed Agents 上线。同一天,一位 ID 叫 @jiayuan_jy 的中国创业者也发了一条推,“We created the open source version of Claude Managed Agents. Introducing Multica.”
真的,你有过这种时刻吗。
这周体验「恒星AI旗下Starfilm」的时候,我整个人是抱着“看你能整出什么花活”的心态上手的。结果……不夸张,从打开网页到生成一条带配乐的完整 AI 漫剧单集,我只用了不到1个小时。
DeepSeek也有自己专属的Coding Agent了。名字简单粗暴,就叫DeepSeek-TUI,作者自称是一名“鲸鱼兄弟”的DeepSeek爱好者。刚刚,这个项目的星标数突然开始骤增,来到了2.3k,还登上了GitHub热榜。
上周太集中发的后果就是光在用GPT -5.5了,小米的Mimo-V2.5-Pro,DeepSeek V4 Pro还没有放在Agent的场景上测。所以我跟钱包一拍即合,复制了4个一模一样的Hermes Agent,记忆一样,skill一样,系统设置一样,能调用的工具也一样。
EverMind 想做点不一样的。这家由盛大集团孵化的公司,定位是为所有AI Agent提供一个通用的"记忆层"(Memory Layer)。它的核心产品EverOS是一套开源的长期记忆系统,开发者可以把它接入自己的Agent,让AI不仅能记住用户的历史对话和偏好,还能像人一样对记忆进行整理、更新,甚至从过去的经验中学习和进化。
和AI聊天,经常会出现一些很荒唐的事儿。这次的主角是豆包。 最近,我在跟豆包聊AI Agent的时候,随口问了一句:李沐(前亚马逊首席科学家)有没有讲过Proactive Agent的视频? 豆包秒